二项检验 – 简易教程
作者:Ruben Geert van den Berg,归类于 非参数检验 & 统计 A-Z
关于在 SPSS 中运行二项检验,请参考 SPSS 二项检验 。
二项检验(Binomial Test)用于检验某个总体比例是否可能为 x。例如,假设我想知道荷兰总体中是否有 50%(比例为 0.50)的人熟悉我的品牌?我们随机抽取了 N = 10 个人进行调查。结果只有 2 个人(比例为 0.2,即 20%)知道我的品牌。这个 0.2 的_样本比例_ 是否意味着_总体比例_ 不是 0.5 呢?或者说,如果总体中确实有 50% 的人知道我的品牌,那么在 10 个人中出现 2 个人知道这个结果是否正常? 二项检验是最简单的统计检验。理解它的工作原理非常容易,并且有助于你更容易地理解其他的 统计显著性 检验。那么它是如何工作的呢?
二项检验 - 基本思想
如果总体比例确实是 0.5,我们有可能得到一个样本比例为 0.2。但是,如果总体比例只有 0.1(只有 10% 的荷兰成年人知道该品牌),那么我们也有可能得到样本比例为 0.2,或者 0.9,或者基本上是 0 到 1 之间的任何数字。下图说明了这里面的基本问题——或者说_挑战_。
真正的总体比例现在能站出来吗?
那么,我们如何才能仅仅基于一个样本就得出关于我们总体的任何结论呢? 首先,我们对总体比例做一个初步的猜测,我们称之为零假设(null hypothesis):即 50% 的人知道我的品牌。 给定这个假设,许多样本比例都是_可能_ 的。但是,有些结果是非常不可能的,或者说是_几乎不可能的_。如果我们确实发现了一个在给定假设下几乎不可能出现的结果,那么这个假设很可能就是错误的:我们可以得出结论,总体比例并不是 x。 这就是我们如何根据样本结果得出总体结论的。基本上所有的 统计检验 都遵循这个推理思路。现在基本的问题是:如果总体比例是 0.5,那么在 10 个样本中发现 2 个成功的概率是多少?
二项检验的假设
首先,我们需要假设独立观察。这基本上意味着任何受访者给出的答案必须独立于任何其他受访者给出的答案。我们的数据满足了这个假设(几乎所有统计检验都需要这个假设)。
二项分布 - 公式
如果某个总体中有 50% 的人知道我的品牌,而我询问了 10 个人,那么我的样本_可能_包含 0 到 10 个成功。这 11 个可能的结果中的每一个及其相关的概率都是二项分布的一个例子,二项分布定义为:
\[P(B = k) = \binom{n}{k} p^k (1 - p)^{n - k}\]
其中:
- \(n\) 是试验次数(样本大小);
- \(k\) 是成功的次数;
- \(p\) 是单次试验成功的概率,或者说是(假设的)总体比例。
注意,\(\) 是 \(\) 的简写,其中 \(!\) 表示 阶乘。
为了实际应用,我们直接从 Google Sheets 获取我们的概率(它在底层使用了前面提到的公式,但它不会用公式来烦扰我们)。
二项分布 - 图表
好的,我们得到了 11 个可能结果(0 到 10 个成功)的概率,并在下面将其可视化。
如果总体比例是 0.5,并且我们抽取 10 个观察值,那么最可能的结果是 5 个成功:P(B = 5) ≈ 0.24。4 个或 6 个成功也是可能的结果(每个 P ≈ 0.2)。 发现 2 个或更少成功(就像我们做的那样)的概率是 0.055。这是我们的 单侧 p 值(one-sided p-value)。 现在,非常低_或者非常高_的成功次数都是不太可能的结果,并且都应该对我们的零假设产生怀疑。因此,我们考虑相反结果的 p 值——8 个或更多成功——也就是另外的 0.055。这样,我们发现 双侧 p 值(2-sided p-value)为 0.11。如果我们抽取 1,000 个样本而不是仅仅 1 个,那么当总体比例为 0.5 时,大约 11% 的样本应该产生 2 个(或更少)或 8 个(或更多)成功。我们的样本结果应该在合理百分比的样本中出现。由于 11% 并不是非常不可能,我们的样本_不_反驳我们的假设,即我们总体中有 50% 的人知道我们的品牌。
二项检验 - Google Sheets
我们在 这个简单的 Google Sheet 中运行了我们的例子。任何人都可以访问它,所以请随时查看。
二项检验 - SPSS
运行二项检验的或许最简单的方法是在 SPSS 中进行——对于一个不错的教程,请尝试 SPSS 二项检验。下图显示了我们当前示例的输出。显然,它返回了与我们的 Google Sheet 相同的 p 值 0.109。
请注意,SPSS 将 p 称为“ 精确 显著性 (双尾) (Exact Sig. (2-tailed))”。那么还有非精确的 p 值吗?嗯,某种程度上是有的。让我们看看它是如何工作的。
二项检验还是 Z 检验?
让我们再来看看我们之前看到的 二项概率分布。它有点像一个 正态分布(normal distribution)。不相信?看看下面的二项分布。
对于 N = 100 的样本,我们的二项分布与正态分布几乎完全相同。这是由 中心极限定理 引起的。一个结果是——对于较大的样本量——单比例的 z 检验(使用标准正态分布)将产生与我们的二项检验(使用二项分布)几乎相同的 p 值。
但是,为什么我们更喜欢 z 检验而不是二项检验呢?
- 我们总是可以使用双侧 z 检验。但是,除非 P₀ = 0.5,否则二项检验总是单侧的。
- z 检验允许我们为我们的样本比例计算一个置信区间(confidence interval)。
- 我们可以很容易地估计 z 检验的统计功效(statistical power),但不能估计二项检验的统计功效。
- z 检验在计算上不那么繁重,特别是对于较大的样本量。我怀疑大多数软件实际上报告的是 z 检验,就好像它是较大样本量的二项检验一样。
那么,我们什么时候可以使用 z 检验而不是二项检验呢?一个经验法则是 P₀ * n 和 (1 - P₀) * n 都必须 > 5,其中 P₀ 表示假设的总体比例,n 表示样本大小。
以上就是关于二项检验的全部内容。希望你觉得本教程有帮助。感谢阅读!